异常值 - 识别和处理数据中的极端值
通过本节学习,你将掌握:
基于四分位数(IQR):
\[\text{异常值} > Q_3 + k \times \text{IQR} \quad \text{或} \quad \text{异常值} < Q_1 - k \times \text{IQR}\]
其中 \( k \) 通常为 1.5
基于均值与标准差:
\[\text{异常值} > \bar{x} + k\sigma \quad \text{或} \quad \text{异常值} < \bar{x} - k\sigma\]
其中 \( k \) 通常为 2